![]() スキャンの方法
专利摘要:
テキストを著作権保護されないコピーから合法的に保護できる、文書(たとえば、新聞または書籍)をスキャンするコンピュータ実施する方法であって、文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録をメモリに獲得するステップと、文字認識を実行するために少なくとも1つの記録を処理するステップと、文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと、事前定義の条件に対してストリングを評価するステップと、条件が満足されない場合に、少なくとも1つの記録の少なくとも一部をメモリからクリアすべきかどうかを判定するステップと、条件が満足される場合に、出力を提供し、ストリングの少なくとも一部および少なくとも1つの記録の少なくとも一部をメモリからクリアするステップとを含む、コンピュータ実施される方法。 公开号:JP2011513849A 申请号:JP2010549148 申请日:2009-03-05 公开日:2011-04-28 发明作者:スティグ ニルセン,ラース;メイボム,ヤコブ 申请人:ジェイエル ホールディングス エーピーエス; IPC主号:G06F21-24
专利说明:
[0001] 本発明は、テキストを許可されないコピーから合法的に保護できる、印刷された新聞ページまたはテキストの他の形の表示などのテキストを含む文書の光学スキャンによって獲得されるディジタル・イメージまたはディジタル記録のコンピュータ実施される処理に関する。] 背景技術 [0002] EU諸国での著作権法の調和に関する2001年5月22日の欧州議会およびEU理事会の指令2001/29/ECは、コピーおよびスキャンに関するルールを示す。同等の米国制定法が、ディジタル・ミレニアム著作権法(DMCA)である。] [0003] スキャンおよびコピーは、従来のスキャナによって実行することができるが、著作権保護された文書の従来のスキャンは、著作権法に違反するので、この問題に対する解決策の必要がある。] [0004] EU Copyright Directive Article 2は、最も基本的な「コピー」権を提供する。これは、作品の「直接または間接の、一時的または永久的な」コピーの複製に対する排他的権利を、実演者、レコード制作者、映画制作者、放送機関、および著作者に与える。EU Copyright DirectiveのArticle 5は、Article 2で提供される権利に適用できる制限および例外を示す。Article 5(1)での複写権に対する必須の例外は、仲介者によるネットワーク伝送の「本質的かつ一体の」部分である「過渡的かつ偶発的な」複写を提供し、あるいは、「独立の経済的重要性」を有しない作品の合法的使用を許可する。] [0005] この例外は、権利者が、ディジタル・テクノロジを介する作品へのすべてのアクセスを制御することをも防ぎ、このディジタル・テクノロジは、まさにその設計によって、作品がDVDなどの媒体から処理のためにプレイヤのメモリに転送され、その後にディスプレイまたはスピーカに転送されるときに、作品の一時的「コピー」を作る。] [0006] 新聞、雑誌、業界誌、科学雑誌、および他の定期刊行物などの著作権保護された刊行物の監視は、組織的に、たとえば重要な記事または他のテキスト・セクションを識別することによってクライアントのために働く媒体監視業の会社によって、実行される。監視は、クライアントの会社および個人が、どれほどしばしばおよびどの程度まで彼らがニュース・メディアで言及されているのかを追跡するのを助けるために実行される。] [0007] 従来、監視は、たとえば新聞を手作業で読むことに基づく。新聞が、たとえば媒体監視会社で受け取られるときに、新聞は、適任の人間の読み手に渡され、この読み手は、関連する記事、たとえば彼らのクライアントに言及する記事を探して新聞を速読する。読み手は、会社名、個人の名前、および/またはある主題、トピック、もしくはテーマを表す他のキーワードなどの単語を探して、記事のどれが関連記事であるのかを判定する。] [0008] 読み手は、新聞のページでキーワードを見つけたときに、そのキーワードをマークする。ページ全体を読み終え、すべてのキーワードをマークし終えたときに、読み手は、キーワードごとの評価を実行して、記事がクライアントに関連するかどうかを判定する。記事が関連することがわかった場合には、読み手またはアシスタントは、クライアントのために記事(1つまたは複数)を物理的に切り抜き、クライアントに送る。] [0009] このプロセスの時間のかかる部分は、キーワードを見つけることに費やされる時間である。左上角から始めて右下角で終わる、1ページあたりの読む時間は、ページ上のキーワードの個数に対してかなり不変である。これは、新聞に少数の関連記事だけがある場合に、切り抜きあたりの長い時間消費をもたらす。したがって、読むことに費やされるこの時間のほとんどは、非効率的である。] [0010] ある程度までは、新聞全体をページごとにスキャンし、ファイル・システムまたはデータ・ベースでの格納のために電子バージョンをたとえばJPGフォーマット、TIFFフォーマット、またはPDFフォーマットで格納するために新聞ページのディジタル・イメージを作る従来のスキャナによって、このプロセスの自動化が可能である。その後、各ファイルが、ファイルを作るために光学文字認識のために取り出され、ここでは、認識された文字が、それぞれ、ある符号化方式(たとえば、ASCII)に従って表される。これらのファイルも、ファイル・システムまたはデータ・ベースに格納される。さらに、いわゆる検索エンジンが、キーワードのセットと共にロードされ、検索エンジンは、切り抜きリストの形で出力を提供するために、文字および文字のシーケンスが符号化されたファイルを取り出す。切り抜きリストは、新聞から記事を切り抜く人に、彼を物理的な新聞のページに向ける情報すなわち、切り抜かれるべき記事のタイトルおよびそのおおよそのロケーションを規定する情報を与える。この自動化プロセスは、手動プロセスよりも生産性を良好に向上させる。] [0011] しかし、ディジタル・イメージは、オリジナル材料の電子コピーを表すので、このプロセスは、多くの制定法の下で著作者の著作権の侵害と考えられる。ある制定法の下では、スキャンされたイメージを表示画面に示すことさえ、著作者の著作権を侵害する行為とみなされる。ディジタル・イメージは、テキストについて直接に検索可能であるのではなく、光学文字認識すなわちOCRによるコーディングされたディジタル形式への変換を必要とする。しかし、この変換からの出力すなわちコーディングされたディジタル形式も、著作権の侵害と考えられる。] [0012] いくつかの国では、電子コピーが「過渡的かつ偶発的」であり、検索プロセスまたは要約記述の「本質的かつ一体」の部分である場合には、これは著作者の著作権の侵害ではないと考えられる場合がある。] [0013] テキスト媒体を手作業で読むことによる媒体監視の伝統的プロセスが自動化される場合には、テキスト媒体のコピーが行われる。テキスト媒体のコピーの作成は、著作権法に関して問題である。したがって、著作権法は、媒体監視の自動化にとって障害となり得る。したがって、テキスト媒体の監視の自動化および著作権法違反の防止は、解決されなければならないままになっている問題である。したがって、テキスト媒体(たとえば、新聞、書籍)の監視の自動化の問題および著作権法違反の防止の問題を解決する技術的解決策の必要がある。] [0014] 従来技術 米国特許第6904183 B2号に、検出器と、検出器に入射する放射を制限するために適合された視野を有するレンズとを有する電子カメラを含む電子イメージ取込装置が開示されている。アクチュエータが、文書にまたがってカメラおよびその視野を移動するために設けられ、コントローラが、文書の異なる区域に対応するオーバーラップするサブイメージのセットを獲得するために設けられる。処理手段が、文書のうちでサブイメージのセットによってカバーされる部分の混成イメージを形成するために設けられる。それぞれのサブイメージに現れる文字に対応する文字のデータ・セットをそれぞれが含むサブイメージのセットが作られる。サブイメージのそれぞれの内容が、空白テキスト文書に縫い合わされて、スキャンされた文書のテキスト内容を含む完全な混成テキスト文書が作られる。サブイメージは、縫い合わせの前に、まず、光学文字認識(OCR)ルーチンに通され、したがって、縫い合わせは、文字レベルで実行される。そのようなスキャナは、いわゆるフラットベッド・スキャナより少ない机のスペースを占有するという利益を有する可能性がある。] [0015] 上の特許出願は、文書のテキスト・スキャンの自動化の問題を解決する。しかし、著作権法に関して、これは、上の特許出願または他の特許出願のどれもが対処せず、解決しない問題ではない。というのは、上の特許出願で、文書がディジタル形式で複製されるからである。コピーは、著作権法に対する侵害なので、この問題は、文書スキャンが新聞または書籍などの印刷されたテキスト媒体に対して行われるときまたはスキャンがeブックなどの電子的に表示されるテキスト文書に対して行われるときに、解決される必要がある。] 先行技術 [0016] 米国特許第6904183 B2号] 発明が解決しようとする課題 [0017] したがって、ニュース・メディアの監視の自動化の問題および著作権法違反の防止の問題は、従来技術では解決されていない。] 課題を解決するための手段 [0018] 開示されるのは、 −文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録をメモリに獲得するステップと、 −文字認識を実行するために少なくとも1つの記録を処理するステップと、 −文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと を含む、文書をスキャンするコンピュータ実施する方法であって、 −事前定義の条件に対してストリングを評価することと、 −条件が満足されない場合に、少なくとも1つの記録の少なくとも一部をメモリからクリアすべきかどうかを判定することと、 −条件が満足される場合に、出力を提供し、ストリングの少なくとも一部および少なくとも1つの記録の少なくとも一部をメモリからクリアすることと を特徴とするコンピュータ実施される方法である。] [0019] ある条件が満足されるときに、出力が提供され、出力がそれらから導出されるストリングの少なくとも一部および少なくとも1つの記録の一部が、文書のコピーを作るのを避け、著作権法を危うくするのを避けるためにクリアされることが有利である。] [0020] その条件が満足されない場合には、あるしきい値を超えるオーバーフローを避けるために、記録の少なくとも一部をクリアすべきかどうかが判定される。文書に関する多すぎる情報が格納されることを避けることができ、留意することができることと、記録の個数の上限またはしきい値に達する前に記録の少なくとも一部をクリアできることとを保証することができる。文字に関する情報は、メモリに格納され、この情報を、スキャンが進行するときに、たとえば、1つの単語が認識され、出力されるときに、クリアすることができる。この方法によるスキャンを、ピープホール・スキャン(peephole scanning)と表す場合がある。] [0021] したがって、文書のスキャンを実行する、コンピュータならびに関連する装置、機器、および/または機械類のハードウェアまたはソフトウェアは、著作権法に関して法律的に正しい形で機能するように調整される。文書の内容に関して示す情報のいずれもがメモリからクリアされない場合には、著作権法に違反する。逆に、文書の内容に関して示す情報全体がクリアされる場合には、テキスト媒体の監視に関して使用可能な情報はない。本発明は、何もクリアしないこととすべてをクリアすることとの間にある、上で説明した方法を提供する。というのは、本発明では、出力が提供される時の、クリアするという選択されたアクションが、テキスト媒体の自動監視を実行することを可能にすると同時に、著作権法の違反を避けるからである。] [0022] したがって、本発明は、上で説明したコンピュータ実施されるスキャン方法によって、テキスト媒体の監視のプロセスを自動化するという問題を解決し、本発明は、文書の内容に関して示す情報の一部をメモリからクリアし、その結果、文書の完全なコピーがメモリ内に絶対に存在しないようにすることによって、著作権法違反を避けるという問題を解決する。] [0023] ピープホール・スキャンは、イメージ・フィールドをシフトされた位置に移動し、カメラを用いて記録を獲得することによって実行することができる。しかし、ピープホールを、より多数のカメラを文書ページの上に取り付け、これらのカメラを順番に使用することによって記録を獲得することによって実行することもできる。さらに、ピープホール・スキャンを、たとえば、文書を表示する画面のビデオ記録または他の形の直列化された文書表現によって実行することもできる。文字のストリングが評価され、出力が作られるときに、ストリングの一部および記録の一部が、文書のコピーまたは文書の諸部分のコピーがスキャン中に作成されることを阻むために、メモリからクリアされる。] [0024] この実施形態のさらなる特徴は、単語全体または単語の一部のいずれかが文字のストリング内で見つかる場合に、この情報を、出力が提供される前にクリアされないものとすることができることである。したがって、この場合には、所望の情報を、単語全体または単語の一部とすることができる。文字のストリング内に単語の表示がない場合には、記録の少なくとも一部をクリアすることもでき、その結果、最終的に、内容または文書の内容に関して示す情報が格納されなくなる。] [0025] さらなる利益は、メモリから情報をクリアすることの技術的影響は、格納される情報の量が減らされ、したがって、すべての情報が格納される場合と比較して、記憶手段のサイズおよび/またはメモリ使用量を減らすことができ、かつ/あるいはこれらがより少ないスペースを占めることであるということである。] [0026] 上で述べた利益のほかに、本発明は、高速で信頼できる、人間によって実行される手作業の仕事のコストを減らす、人間が実行する可能性がある誤りおよび不規則を減らす、その他など、自動化の既知の技術的効果および利益を含む。] [0027] さらに、文書のスキャン中にデータが継続的かつ規則的にメモリからクリアされ、削除されるので、従来技術と比較して、メモリまたはデータ・メモリに関する記憶容量があまり必要でない可能性があることが、有利である。] [0028] 文字は、アルファベットの字、漢字、数字、句読点、およびすべての世界中の書記体系のすべての個々の記号など、字、記号、符号、および/または書記素とすることができる。] [0029] 一実施形態では、事前定義の条件が満足されない場合に、少なくとも1つの記録の少なくとも一部をメモリからクリアすべきかどうかを判定することは、 評価された文字の個数を判定すること を含み、 −事前定義の個数未満の文字が評価されている場合に、少なくとも1つの記録の少なくとも一部はクリアされず、 −事前定義の個数以上の文字が評価されている場合に、少なくとも1つの記録の少なくとも一部はクリアされる。 この実施形態の利益は、事前定義の個数以上の文字が評価された場合に、少なくとも1つの記録の少なくとも一部がメモリからクリアされることである。したがって、この実施形態は、文書の内容に関して示す情報の上限またはしきい値を超えないことを保証する。しかし、事前定義の個数未満の文字が評価されている場合には、少なくとも1つの記録の少なくとも一部はクリアされない。というのは、文書の内容について示すより多くの情報を、クリアの前に格納できるからである。] [0030] 一実施形態では、この方法は、条件が満足されない場合に、ストリングの少なくとも一部をメモリからクリアすべきかどうかを判定することをさらに含む。] [0031] 条件が満足されない場合には、ストリングの少なくとも一部がメモリからクリアされることが有利である。というのは、これが、文書の内容について示す情報を減らすことができるからである。] [0032] 一実施形態では、事前定義の条件は、文字のストリングが少なくとも1つの単語を含むか、少なくとも1つの単語として識別されることを含む。この実施形態の利益は、文字のストリングが単語を含むときに、その単語が登録され、単語がそこから導出されたストリングおよび記録(1つまたは複数)の少なくとも一部が、文書のコピーを作るのを避け、著作権法に違反するのを避けるためにクリアされることである。] [0033] 一実施形態では、少なくとも1つの単語を含むインデックス・リストが提供される。この実施形態の利益は、認識された単語がインデックス・リストに登録され、これによって、この情報が、文書の内容に関して示すものになり、この単語に、たとえばキーワード・リストとの後続マッチングのためにアクセスできることである。] [0034] 一実施形態では、この方法は、少なくとも1つの単語が事前定義のストップワードのうちの1つと一致する場合に、インデックス・リストから少なくとも1つの単語をクリアし、除外し、または省略することを含む。いくつかの単語または他の語のグループが、絶対にキーワードとして定義されない可能性があるので、文書からのすべての単語がインデックス・リスト内で提供されるのではないことが、この実施形態の利益である。インデックス・リストからこれらのいわゆるストップワードを除外することによって、インデックス・リストを、すべての単語がインデックス・リストに含まれる場合より短くすることができ、インデックス・リストが望まれない単語および情報を含まないときには、情報は、アクセスがより簡単である可能性がある。これらのストップワードまたはストップワードのグループは、たとえば、「たとえば(for example)」、「および(and)」、「その他(and so on)」、「とりわけ(amongother)」、「or(または)」、「the」、「a」、「その他(etc.)」、および/または類似物などの単語とすることができる。ストップワードの定義は、ストップワードまたはストップワードのグループが、文書の内容に関する意味のある、貴重な、または重要な情報を表さないこととすることができる。ストップワードの反対は、ヒットワード(hit−word)、たとえば、文書の内容に関する情報を含む単語と定義することができる。したがって、インデックス・リストを、文書の内容に関する意味のある情報を含む単語を含むリストと定義することができる。] [0035] 代替案では、ストップワードが単語として出力される前ですら、ストップワードをメモリからクリアすることができる、すなわち、この方法は、少なくとも1つの単語が事前定義のストップワードのうちの1つと一致する場合に、その単語をクリアし、除外し、または省略することを含む。さらに、この方法は、クリアされず、除外されず、かつ省略されない文字のストリングから導出された少なくとも1つの単語を含むインデックス・リストを提供することを含むことができる。] [0036] 一実施形態では、単語は、単語の前および後にスペースがあるという点において識別される。この実施形態の利益は、単語を、この方法によって簡単に識別できることである。スペースは、文内の単語の間のスペースとすることができる。スペースは、文字がなく、したがって文書がこれらのロケーションに情報を含まない、空白またはギャップとすることができる。表現「前」および「後」は、隣接しておよび/または直接に前および後を意味するものとして定義することができる、すなわち、スペースは、単語のすぐ隣の隣接する場所、部位、位置、または区域とすることができる。] [0037] ある単語が、あるテキストの最初の単語または行間隔もしくは行シフトの後の最初の単語である場合には、その単語の前にはスペースがなく、その単語の後だけにスペースがある場合がある。] [0038] 一実施形態では、単語は、単語の前にスペースがあり、単語の後に字とは異なる文字があるという点において識別される。この実施形態の利益は、この方法によって、文の最後の単語を識別できることである。文の最後の単語の後には、スペースがあるのではなく、終止符、コンマ、感嘆符、疑問符、または類似物がある場合がある。] [0039] その代わりにおよび/またはそれに加えて、単語が、上付きおよび/または下付きのテキストを含む場合があり、単語が、引用符によって枠にはめられる場合があり、単語が、絵の中に存在する場合があり、単語が、ハイフンによって複数の行に分割される場合があり、単語が、ハイフネーションされる場合などがある。] [0040] 一実施形態では、単語は、1つまたは複数の言語のすべての単語を含むデータ・ベースによって識別され、文字のストリングとデータ・ベース内の単語との間に一致または収束がある場合に、または文字のストリングがデータ・ベース内の単語のうちの1つとして認識される場合に、文字の前記ストリングは単語と定義される。この実施形態の利益は、単語を、文書のテキストが書かれた言語の単語を含むデータ・ベース内で認識されることによって識別できることである。言語は、書かれた言語および/または話された言語と定義することができる。] [0041] 一実施形態では、出力は、識別される少なくとも1つの単語である。この実施形態の利益は、少なくとも1つの単語を出力することによって、文書の内容に関して示す情報を検出することが可能になることである。] [0042] 一実施形態では、出力は、少なくとも1つの単語が配置される文書内のロケーションへの参照である。この実施形態の利益は、出力が、文書内の単語の位置、ロケーション、または区域の参照として作られ、したがって、後に、記録および単語がメモリからクリアされたときに、その出力を見つけることができ、したがって、単語ロケーションに関する情報を含む記録のロケーションへの参照が与えられることである。ロケーションは、記録のおおむねのロケーションなどとすることができる。位置判定と共に記録を獲得することが有利であり、この位置判定は、後に、文書内の単語のロケーションへの参照を与えることをより簡単にする。] [0043] 一実施形態では、少なくとも1つの単語の文書内のロケーションまたは位置に関する情報は、生成され、格納される。] [0044] 一実施形態では、少なくとも1つの単語は、コードとして表される。この実施形態の利益は、単語として識別される文字のストリングの出力を、文字、字、記号、符号、参照番号、キーワードのリストへのインデックスその他など、任意の適切なコードによって表すことができることである。] [0045] 一実施形態では、出力は、インデックス・リストおよびスキャンの対象である文書内の対応する単語のロケーションを表す位置への参照を含む。この実施形態の利益は、インデックス・リストおよびロケーション参照が出力されることである。というのは、これによって、文書の内容に関して示す情報および文書内の単語のロケーションを示す情報を検出することが可能になるからである。] [0046] 一実施形態では、生成されるキーワード・リストは、複数の所定のキーワードを含む。この実施形態の利益は、キーワード・リストを生成することによって、文書内のキーワードを検出することを可能にすることができることである。キーワードは、文書内で検索される単語として選択される単語とすることができる。というのは、キーワードが、たとえば名前、会社などが新聞などでどのように言及されるかを知ることを望むクライアントにとって重要である可能性があるからである。キーワードを、人の名前、会社名、製品の名前などとすることができる。] [0047] 一実施形態で、キーワード・リストは、インデックス・リストと比較され、キーワード・リスト内のキーワードとインデックス・リスト内の単語との間に一致がある場合に、この単語は抽出され、記録され、または書き留められる。この実施形態の利益は、インデックス・リストが事前定義のキーワード・リストと比較され、この2つのリストの間で一致を見つけることができるときに、インデックス・リストとキーワードリストとの両方に現れる単語が抽出されることである。] [0048] 文書の情報のうちで関連する片すなわちキーワードを見つけるために、電子入力の内容ベースの評価を実行できることが有利である。これは、フィルタリングと定義することができ、したがって、内容のフィルタリングまたは内容に関して示す情報のフィルタリングを実行することができる。入手することが望まれる情報を抽出し、残りをフィルタリングによって除去するために、文書の内容をフィルタリングすることができる。内容のフィルタリングを実行するために、フィルタ・プロパティを定義することができる。フィルタ・プロパティを、事前定義の条件によって定義することができる。事前定義の条件は、たとえば、単語の認識、キーワードの認識、文字のストリングの最大長などとすることができる。キーワードの認識がフィルタ・プロパティである場合には、これに従って、キーワードだけがフィルタを通過し、文書内の情報の残りは、置き去りにされる。文書の内容をフィルタリングすることによって、文書の完全なコピーは作られず、所望の情報だけが文書から抽出される。所望の情報は、文書内のすべての情報より少ない情報とすることができ、その結果、文書の内容の一部だけが抽出されるようになり、したがって、文書の一部は、絶対に出力として提供されないものとすることができる。] [0049] 実際には、フィルタが単語またはキーワードを認識するときに、その単語またはキーワードおよび文書内のその位置を格納することができる。単語またはキーワードおよびその位置が格納されるや否や、その単語またはキーワードを含んだ記録、たとえばイメージを削除することができる。というのは、その単語またはキーワードに関して必要とされる情報のすべてが登録されているからである。この形で、文書のコピーは全く生成されない。というのは、スキャンが、フィルタリング・プロセスに関係し、コピー作成には関係しないからである。] [0050] この実施形態のさらなる利益は、単語またはキーワードをその後に配置でき、その後に文書のテキストの切り抜き、リスト生成、要約記述などでの使用のために再発見できることである。文書内の単語またはキーワードの位置を示す文書テンプレートを提供することができ、この文書テンプレートは、文書のコピーを作らずにオリジナル文書内の単語またはキーワードの物理的ロケーションの概要を与えるように働くことができる。キーワード以外のすべての単語を、たとえば、文書テンプレート内で灰色の区域によって表すことができる。単語またはキーワードのフォント・サイズおよびたとえばグレイスケール色をも文書テンプレート内で示すことができ、その結果、単語またはキーワードが見出し、本文などに配置されているかどうかを判定することが可能になる。] [0051] この実施形態のさらなる利益は、文書内の単語またはキーワードの位置を、スキャンの後に見つけることができ、この情報を使用して、互いに対する相対的な単語またはキーワードの位置を比較し、ある種の単語またはキーワードが互いの近くに配置されているかどうかを判定できることである。単語またはキーワードは、他の単語またはキーワードと組み合わされたときに特殊な意味を有する場合があり、これらの互いに対する相対的なロケーションは、クライアントにとって重要な情報を含む可能性がある。] [0052] 単語またはキーワードの位置に関する情報は、 −単語またはキーワードの座標によって、 −単語またはキーワードがある行の位置によって、 −単語またはキーワードがある文書内の単語数によって、 −印刷記号によって(印刷記号は、終止符、コンマ、および類似物を含む)、 −単語またはキーワードがある文書内の文章数によって、 −単語またはキーワードがあるセクションまたは段落の個数によって など、さまざまな手段によって識別することができる。] [0053] 一実施形態では、この方法は、選択された記録を一緒に合成記録に縫い合わせることを含む。この実施形態の利益は、選択された記録をより大きい記録またはイメージに縫い合わせることが可能であることである。これが有利であるのは、スキャンが文字の多数の異なるフォント・サイズすなわち、見出しのより大きい文字フォント・サイズおよび本文、キャプションなどのより小さいフォント・サイズを含む新聞について実行される場合に、フィールド・サイズが、時々、文字のフォント・サイズよりはるかに小さい(小さい記録またはイメージ・サイズ)からである。また、フィールド寸法が、たとえば文字認識の対象である最小文字のフォント・サイズの5倍未満であることが好ましい場合があるので、より大きい文字は、しばしば、複数の記録にまたがって延び、したがって、選択された記録を一緒に縫い合わせることが必要である。文書ページ上の文字のフォント・サイズは、たとえばオペレータによるキー入力または類似物によるなど、入力としてピープホール・スキャナに提供することができる。] [0054] 一実施形態では、合成記録は、複数の選択された記録にまたがって延びる文字の認識を実行するために処理される。この実施形態の利益は、記録を一緒に縫い合わせた後に、合成記録が完全な文字のイメージまたはレコードを提供するので、複数の選択された記録にまたがって延びる文字の文字認識を実行できることである。] [0055] 一実施形態では、選択された記録を一緒に合成記録に縫い合わせるステップは、文字を認識するための少なくとも1つの記録の処理が文字の認識をもたらさなかったときに実行される。この実施形態の利益は、少なくとも1つの記録の処理から文字を認識することが可能ではないときに、合成記録の縫い合わせおよび処理が実行されることである。この形で、文字が複数の記録にまたがって延びる場合であっても、それらの文字を判定することができる。] [0056] 一実施形態では、事前定義の条件は、縫い合わされた合成記録が、事前定義の個数の記録が縫い合わされたときに文字の認識をもたらすかどうかを含む。] [0057] この実施形態の利益は、合成記録が文字に似ていない場合に、注意が払われ、処理を停止できることである。その場合に、合成記録は、絵の一部である可能性が高い。事前に定義された個数の縫い合わされた合成記録は、スキャナが文字を検索する処理中であることに起因して、絵全体が、故意でなく処理されることがないことを保証することができる。この方法によって、適切な事前定義の最大個数の縫い合わされた記録が選択されることによって、著作権法に違反しないことが保証される。この実施形態のさらなる利益は、記録の個数の上限またはしきい値に達する前に注意が払われることを保証することである。停止の前に多すぎる記録が評価される場合には、スキャンの著作権法に違反する可能性があるが、この実施形態は、これが起きないことを保証する。] [0058] 一実施形態では、事前定義の条件は、同一の色が隣接する記録に現れることを含む。この実施形態の利益は、隣接する記録すなわち互いに隣り合う記録が、同一の色を含む場合に、これらの記録が絵ではなく文字の記録である可能性が高いことである。その一方で、隣接する記録が同一の色を含まない場合には、これらの記録が絵、写真、線描、または類似物である可能性が高い。絵のスキャンを避けるために、文書のこの部分のスキャンは、クリアされる。] [0059] 一実施形態では、合成記録は、事前定義の条件が満足されるときにクリアされる。この実施形態の利益は、ある条件が満足されるとき、たとえば、出力が作られ、文書からのすべての所望の情報が入手されたときに、記録の縫い合わせをクリアできることである。この形で、文書のコピーを作ることが回避され、著作権法違反が回避される。] [0060] 一実施形態では、事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む。この実施形態の利益は、評価された文字の個数が事前定義の上限またはしきい値を超える場合に、文字認識プロセスが停止することを保証することである。多すぎる文字が評価される場合には、著作権法に違反する可能性があるが、この実施形態は、これが起きないことを保証する。] [0061] 一実施形態では、事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む。この実施形態の利益は、文字フォント・サイズが最大の事前定義のフォント・サイズより大きい場合に、大きい文字のスキャンを避けるために文字認識プロセスが停止することであり、この大きい文字のスキャンは、そうでなければ非常に時間のかかるプロセスになる可能性があり、これは、望まれないものである可能性がある。] [0062] 一実施形態では、フィールドは、連続するテキストすなわち切れ目のないテキスト内で互いの隣に配置された11個の単語という寸法を有するように構成される。代替案では、フィールドは、連続するテキスト内で互いの隣の5個の単語、連続するテキスト内で互いの隣の15個の単語、連続するテキスト内で互いの隣の20個の単語、連続するテキスト内で互いの隣の25個の単語、または類似物の寸法を有するように構成される。フィールドが、連続するテキスト内で互いの隣に配置された11個の単語を含む場合に、そのフィールドは、書籍の1ページの幅またはA4文書のサイズの文書の幅をカバーする可能性があり、フィールドの高さは、フォントのサイズである可能性がある。新聞のページなどの複数列ページをスキャンする場合に、各列の行は、連続するテキスト内で互いの隣の11個未満の単語を含む場合があり、したがって、複数列ページの幅も、連続するテキスト内で互いの隣の11個未満の単語を含む可能性がある。複数列ページの幅は、11個を超える単語を含む場合があるが、この11個の単語は、連続するテキスト内で互いに隣り合わない可能性がある。したがって、一実施形態では、フィールドは、文書の幅および文字のフォント・サイズの高さに対応する寸法を有するように構成される。] [0063] 一実施形態では、フィールドは、文字認識の対象になる最小文字のサイズの5倍未満の寸法を有するように構成される。代替案では、フィールドは、 −10mm、20mm、30mm、または類似物の寸法を有するように、 −文書ページあたりのフィールドの所定の個数、たとえば100個または200個に対応して、 −最大の文字フォント・サイズに対して相対的に、 −最小の文字フォント・サイズに対して相対的に、 −文書ページ・サイズに対して相対的に など、定義された寸法を有するように構成される。] [0064] この実施形態の利益は、多すぎる文字が1つの記録内でスキャンされないことを保証することである。というのは、これが、多すぎるテキストがスキャンされることをもたらし、したがって、故意ではなく著作権法に違反し得ることをもたらし得るからである。フィールドが、たとえば最小文字のフォント・サイズの5倍未満の寸法を有することを保証することによって、故意ではなく一時に多すぎる文字をスキャンすることが可能ではなくなる。] [0065] フィールドの寸法を、最小文字のフォント・サイズの4倍未満にすることができ、あるいは、最小文字のフォント・サイズの6倍未満にすることができることも、可能である。好ましくは、イメージ(1つまたは複数)および文字のストリングがクリアされる前に、単語全体がスキャンされ、認識される。しかし、単語が認識されることなく多数の文字がスキャンされる場合には、文字のストリングおよびイメージを、単語が認識されることなくクリアすることができる。こうなるのは、テキストが、文字認識システム/ソフトウェアが知らない言語または単語を含み、したがって、文書の多すぎる部分を格納する(著作権法に違反する可能性がある)ことを避けるために、所定の個数の記録が行われた後に文字およびイメージをクリアできる場合とすることができる。] [0066] 一実施形態では、少なくとも2つの記録は、同時に獲得される。この実施形態の利益は、たとえば同時に垂直により多くの記録を獲得することによって、スキャン・プロセスが、かなりより高速になり得ることである。それと同時に、著作権法に対する侵害になり得る多すぎるテキストの記録の危険性は、存在しない。というのは、垂直により多くの記録を獲得することによって、文書ページ上で水平に記述された単語および文が、同時には記録されないからである。各記録は、光学文字認識を実行するために記録が処理され終えたときに、最終的にクリアされ、現れる単語が認識され、したがって、文書のコピーは作られない。] [0067] さらに、いくつかの言語およびいくつかの国では、読むことが、左から右ではなくページ上で右から左へ、および/または水平ではなく垂直に、および/またはページの最上部からページの最下部ではなくページの最下部からページの最上部へなどで行われる可能性がある。したがって、スキャンを、左から右ではなくページ上で右から左へ、および/または水平ではなく垂直に、および/またはページの最上部からページの最下部ではなくページの最下部からページの最上部へなどで実行することもできる。] [0068] いくつかの実施形態では、スキャンされる文書上のテキストの処理が、機械翻訳(MT)を含む場合があり、この機械翻訳は、コンピュータ・ソフトウェアが、テキストをある言語から別の言語へ翻訳するのに使用される計算言語学の一分野である。基本的に、機械翻訳は、ある言語の単語の、別の言語の単語への単純な置換を実行する。機械翻訳は、ルールベースの機械翻訳、例ベースの機械翻訳、統計的機械翻訳(SMT)などとすることができる。] [0069] いくつかの実施形態では、スキャンされる文書上のテキストの処理が、言い換え(rewording or rephrasing)を含むことができる、すなわち、テキストの単語または文をオリジナルの単語または文と同一の意味を有する同一言語の異なる単語または文に言い換える(reworded or rephrased)ことができる。本発明による方法を使用するときに、たとえば、3つの単語がスキャンされ、メモリに格納され、その後、処理される。この3つの単語の意味(meaning or sense)が、ソフトウェア・プログラムによって生成され、3つのオリジナル単語の1つまたは複数の同義単語または同義文が生成される。これによって、オリジナルと同一の意味(meaning or sense)を有するが著作権法に違反しない、オリジナルの単語、文、またはテキストの同等の単語、文、またはテキストが生成される。3つより多数または少数の単語を、オリジナルのテキストまたはテキストの一部の言い換え(rewording or rephrasing)のために処理することができることを理解されたい。] [0070] ピープホール・スキャン・プロセスのいくつかの実施形態では、スキャンされる文書は、スキャンの前に、ある種のカバリングによって第1区域で部分的に隠されるかカバーされ、カバーされた文書がスキャンされ終え、内容およびイメージが処理され、削除されたときに、その文書は、スキャンの前に、ある種のカバリングによって今度は反対の第2区域で、やはり部分的に隠されるかカバーされる。] [0071] スキャンを、スキャンされる文書を部分的にカバーし、その後、反対の区域で文書を部分的にカバーすることによって実行できることは、有利である。というのは、これが、スキャンを高速に効率的に実行できることをもたらすからである。] [0072] 本発明は、上および次で説明する方法ならびに、それぞれが最初に述べられた態様に関連して説明される利益および長所のうちの1つまたは複数をもたらし、それぞれが最初に述べられた態様および/または添付の特許請求の範囲で開示される態様に関連して説明される実施形態に対応する1つまたは複数の実施形態を有する、対応する方法、デバイス、使用、および/または生産手段に関する。] [0073] 具体的に言うと、本明細書では、コンピュータ上で実行されるときに上の実施形態のいずれかに記載の方法を実施するプログラムを符号化されたコンピュータ可読媒体が開示される。] [0074] さらなる態様は、スキャン・デバイスと、プログラムがコンピュータ上で実行されるときに上の実施形態のいずれかに記載の方法を実施するプログラムをロードされたコンピュータとを含むシステムである。] [0075] さらなる態様は、 −文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録を獲得するスキャン・ヘッドと、 −記録内の文字を認識するように適合されたプロセッサと、 −少なくとも1つの記録を格納し、認識された文字を格納するデータ・メモリと、 −実施形態のいずれかに記載の方法を実行するためにプロセッサ上の実行可能プログラム命令のセットを格納するプログラム・メモリと を含む文書スキャナである。] [0076] 実施形態の詳細な説明を、図面を参照して下で与える。] 図面の簡単な説明 [0077] スキャン方法を示す流れ図である。 ピープホール・スキャナの全体的処理を示す図である。 ピープホール・スキャン・プロセスの例を示す図である。 読取りヘッド移動をかぶせられた新聞紙のセクションを示す図である。 ピープホール・スキャン・プロセスの例を示す図である。] 実施例 [0078] 本発明のディジタル・スキャナは、文書のディジタル・コピーを作成せずに文書をスキャンする。スキャン動作のどの所与のときにも、いわゆるピープホール・スキャナは、少数の単語または単語の部分がクリアされるか上書きされる前に、そのメモリ内にその単語または単語の部分のみを含むことができる。文書内の情報を、文書の単語を含むインデックス・リストによって保存することができる。このスキャンおよび検索方法によって、ユーザは、それぞれの著作者の著作権を決して侵害しない。] [0079] 図1に、スキャン方法の流れ図を示す。スキャンは、記録の位置をシフトすること101によって、たとえば、文書、たとえば新聞の表面にまたがって順次の形で移動するスキャナによって実行することができ、各ステップについて、スキャナは、文書のフィールド内の記録、たとえばイメージを獲得する102。フィールドは、好ましくは小さく、フィールドのサイズは、さまざまな形で定義することができる。 −文字認識の対象である最小文字のフォント・サイズの5倍未満の寸法を有するようにフィールドを構成することができ、 −10mmの寸法を有するようにフィールドを構成することができ、 −文書ページあたりの所定の個数の記録またはイメージのフィールドに対応する寸法を有するようにフィールドを構成することができ、 −最大文字フォント・サイズに対する相対的な寸法を有するようにフィールドを構成することができ、 −最小文字フォント・サイズに対する相対的な寸法を有するようにフィールドを構成することができ、 −文書ページ・サイズに対する相対的な寸法を有するようにフィールドを構成することができる。] 図1 [0080] 上で述べたように、ピープホール・スキャンは、イメージ・フィールドをシフトされた位置に移動することと、カメラを用いて記録を獲得することとによって実行することができる。] [0081] 代替案では、ピープホール・スキャンを、文書ページの上により多数のカメラを取り付け、これらのカメラを順番に使用することによって記録を獲得することによって実行することもできる。たとえば、100台のカメラを、正方形の文書の上に取り付けることができ、右上角の第1のカメラは、第1の記録を獲得することができ、第1のカメラの隣の第2のカメラは、第2の記録を獲得することができ、文書全体がスキャンされるまで、以下同様である。] [0082] ピープホール・スキャンを、たとえば電子ブックすなわちeブックなどの電子文書を表示する画面のビデオ記録によって実行することもできる。画面上の文書は、固定されたピープホール・スキャナ、たとえばビデオ・カメラの前で文書を画面上で上下にスクロールすることによって、または画面を横切ってピープホール・スキャナを移動することによってのいずれかで記録することができる。すべての場合において、スキャンは、水平にまたは垂直になど、実行することができる。さらに、ビデオ・スキャンを、ビデオ・グラフィックス・アレイ(VGA)モニタ信号または類似物などのコンピュータからのモニタ出力を使用することによって実行することができる。モニタ信号は、モニタに表示される電子文書を直列化されて搬送する。ピープホール・スキャナは、直列化されたモニタ信号から、ピープホール・ウィンドウ、たとえばそれぞれ40個の連続する走査線内の40個の画素を抽出することができ、これによって、ピープホール・ウィンドウに対応する絵を、モニタ信号から取り出すことができる。その後、ピープホール・ウィンドウを、上もしくは下にまたは左もしくは右にまたは斜めなどに移動することができ、新しいピープホール・ウィンドウを、ピープホール・スキャナによってスキャンすることができる。各スキャンでは、ピープホール・ウィンドウに対応する絵がとられる。その後、記録されたデータを、コンピュータ内で文字認識によって変換し、上で説明したように処理することができる。] [0083] スキャンプロセスの各ステップの後に、ピープホール・スキャナは、文書の表面のセグメントの小さい記録、たとえばイメージを含む103。記録は、グレイスケール、白黒すなわち2進、またはカラーのいずれかとすることができる。各記録セグメントまたはイメージセグメントは、光学文字認識(OCR)によって分析されて、文字、文字の一部、絵の一部、空白フィールド、またはその組合せを含むかどうかが判定される104。] [0084] 記録セグメントが文字を含む場合には、それを登録し、いわゆるワードビルダ(Wordbuilder)に転送する105、下を参照されたい。記録セグメントが文字の一部を含み、その文字がこれによって認識はされない場合には、次の記録を行い106、OCRを待って、記録セグメントを一緒に解いて文字を形成できるかどうかを判定し、ここで形成された文字は、ワードビルダに転送することができる。] [0085] 記録セグメントが絵または絵の一部を含む場合には、著作権保護された絵、写真などごとにコピーを作るのを避けるために、絵の一部をクリアすることができる。記録セグメントの残りは、それを後続の記録セグメント(1つまたは複数)と一緒に解いて文字を形成できるかどうかを判定するのに使用される。] [0086] 連続プロセスで、ワードビルダは、スキャンされた文字を収集し、その単語を形成する。単語が形成されるときに、107の事前定義の条件が満足され、出力が提供される108。その後、記録を継続して、文書全体を検索することができる。文字のストリングが事前定義の条件と一致しない場合には、少なくとも1つの記録の少なくとも一部をメモリからクリアしなければならないかどうかを判定する109。クリアの判定109は、評価された文字の個数に基づくものとすることができる。一実施形態では、評価された文字の個数が事前定義の数未満の場合には、少なくとも1つの記録の少なくとも一部がクリアされず、評価された文字の個数が事前定義の数以上の場合には、少なくとも1つの記録の少なくとも一部がクリアされる。少なくとも1つの記録の少なくとも一部がステップ110でクリアされるか否かにかかわらず、記録およびスキャンを継続することができる106。] [0087] 文字のストリングから単語を見つけたとき、文字のストリングが、たとえば2つの行にまたがって広がる単語を形成するとき、および単語がハイフンによって分割されるときにも、文字のストリング全体が検査される。したがって、ピープホール・スキャナは、ハイフンが現在の行の最後の文字記号として現れる場合には、次の行のスキャンを継続する。] [0088] ピープホール・スキャナは、従来のスキャナのように機能することができる。従来のスキャナは、イメージ・フィールドをセットし、イメージを撮影し、イメージをメモリに格納することによって機能する。さらに、従来のスキャナは、OCRのタスクおよび検索エンジン(SE)処理(たとえば、キーワードを見つける)のタスクを実行することができる。従来のスキャナがこれらのステップを実行するときには、獲得された情報が格納され、これによって、スキャンされた文書のコピーが作られる。スキャナは、フラットベッド・スキャナ、ローラー・スキャナ、フィーダー・スキャナ、または類似物とすることができる。] [0089] ピープホール・スキャナは、これらと同一の3つのタスクすなわち、スキャン、文字認識、およびおそらくはキーワード・マッチングを実行することができる。しかし、ピープホール・スキャナは、1つの連続動作で、文書のコピーを全く作成せずに、これらのタスクを実行する。従来のスキャナは、通常、文書全体のイメージを同時に獲得するが、ピープホール・スキャナは、一時に文書の区切られた区域のイメージだけを獲得する。] [0090] 図2に、ピープホール・スキャナの全体的処理を示すが、図1は、その詳細なプロセスを示す。ピープホール・スキャナは、図1に示されているように、文書を「読み取り」301、光学文字認識(OCR)を実行し302、単語を検索する303。結果の出力は、スキャンされた文書が含む単語のある種の表示である。この表示を、切り抜きリストの作成、インデックス・リストの作成、要約記述を可能にするためなど304、さまざまな目的に使用することができる。] 図1 図2 [0091] ピープホール・スキャナは、ハードウェア・コンポーネント、ファームウェア・コンポーネント、およびソフトウェア・コンポーネントを組み合わせることができる。] [0092] 図3に、ピープホール・スキャン・プロセスの例を示すが、この例は、全体的に、図1と同様に機能する。図3a)では、文書ページ401が、スキャナ402の下に置かれる。スキャナの読取りヘッド403が、トラック(1つまたは複数)405上に配置され、トラック(1つまたは複数)405は、文書の表面全体にわたって移動するために、グライダ(1つまたは複数)406上で移動することができる。読取りヘッド403は、フラット・ケーブル、USB接続、赤外線通信、または類似物によって、読取りヘッド移動コントローラ408およびスキャン・シーケンサ(SS)407(図3b)を参照されたい)に接続される。一例では、読取りヘッドは、8ビット・グレイスケール分解能を有する100×100画素のCCDアレイである。したがって、ピープホールは、1cm×1cmに対応する物理的ウィンドウ・フィールド内に10000個の画素を含み、これは、タブロイド・ページ・サイズの1/1000と等しい。] 図1 図3 図3a 図3b [0093] 読取りヘッドの一例にここで言及するが、読取りヘッドが任意の仕様を有することができることを理解されたい。] [0094] 図3bでは、スキャン・シーケンサ(SS)407が、読取りヘッド移動408を制御する。一般に、読取りヘッドの移動は、戻りサイクルを伴って左から右へである。光学文字認識(OCR)409およびジグソーOCR 410(下を参照されたい)の結果が、水平に左、垂直に下、または斜めに上など、別の形で読取りヘッドを移動する要求についてステージをセットする場合には、このシーケンスを変更することができる。] 図3b [0095] 読取りヘッド移動408を、イメージ獲得デバイスの標準規格であるTWAINインターフェースによって制御することができる。TWAINインターフェースは、スキャナ読取りヘッドの位置すなわち、読取りヘッドのx,y座標と、座標の増分すなわちΔx,Δyなどを制御することができる。] [0096] OCR409は、一連のタスクを実行する。OCR 409は、ピープホール・フィールドの内側区域を検索して、1つまたは複数の完全な文字を突き止めることができ、その後、境界を検索して、文字の部分を形成できる形状を突き止めることができる。OCR 409は、垂直境界線および水平境界線の片を探す。OCR 409は、行間隔を探すことができ、アラインメントを評価する。OCR 409は、連続する符号および列分離間隔を探すことができる。OCR 409は、より大きい文字の一部である可能性があるモノグレイトーン(mono−grey−tone)形状を探すことができる。OCR 409は、絵の一部である可能性がある変化するグレイトーンを有する区域を探すことができる。認識された文字は、たとえばそのフォント・サイズおよび文書内の位置と共に、ワードビルダ411に転送される。] [0097] OCRタスクの例にここで言及するが、OCRスキャンを任意の適切な形で実行できることを理解されたい。] [0098] ジグソーOCR410は、隣接するピープホール・イメージまたは記録を組み合わせて、ウィンドウ、たとえば2個、4個、9個、または16個のピープホール・イメージを形成し、このウィンドウは、その後、反復プロセスでOCRにかけられる。ジグソーOCR 410は、スキャン・シーケンサ407と相互作用し、文字の完全なイメージを作るためにそれが必要とする隣接するピープホールを要求する。8つまでの隣接スキャンと組み合わされた各スキャンが、文字または文字の一部、線、および絵の認識のために分析される。] [0099] ワードビルダ411は、OCR409およびジグソーOCR 410から文字を1つずつ、たとえばそのフォント・サイズおよび位置を含めて、受け取る。文字のストリングは、同等のスペース/空白文字および改行を含む。ワードビルダ411は、文字を単語に組み立て、インデックス・リストが提供され、このインデックス・リストは、文書からの単語を含む。インデックス・リストをキーワード・リストと比較して、文書内のすべてのキーワードを見つけることができる。文書内で見つかる単語または文字を、空白にする/クリアするか特殊文字によって置換することができる。絵、写真、および類似物を有する区域を、事前定義のグレイトーンまたはピクセルと置換することができる。スペース文字および垂直行検出と組み合わされたジグソーOCRスキャンは、ページの所与の区域での列分離の尤度を評価することができ、文書の内容を処理するときにこの情報を考慮に入れることができる。] [0100] 最後に、ページの最終スキャンの後に、HITコレクタ412が、単語およびたとえばタイトル行のリストを組み立て済みである場合があり、結果の出力は、単語および文書内の単語の位置のインデックス・リストとすることができ、あるいは、任意の他の適切な出力フォームとすることができる。その後、インデックス・リストをキーワード・リストとマッチングして、いずれかのキーワードが文書に存在するかどうかを見つけることができる。] [0101] その代わりにおよび/またはそれに加えて、いくつかの実施形態では、スキャンされる文書上のテキストの処理は、機械翻訳(MT)を含む場合があり、この機械翻訳は、コンピュータ・ソフトウェアが、テキストをある言語から別の言語へ翻訳するのに使用される計算言語学の一分野である。基本的に、機械翻訳は、ある言語の単語の、他の言語の単語への単純な置換を実行する。機械翻訳は、ルールベースの機械翻訳、例ベースの機械翻訳、統計的機械翻訳(SMT)などとすることができる。] [0102] その代わりにおよび/またはそれに加えて、いくつかの実施形態では、スキャンされる文書上のテキストの処理が、言い換え(rewording or rephrasing)を含むことができる、すなわち、テキストの単語または文をオリジナルの単語または文と同一の意味を有する同一言語の異なる単語または文に言い換える(reworded or rephrased)ことができる。本発明による方法を使用するときに、たとえば、3つの単語がスキャンされ、メモリに格納され、その後、処理される。この3つの単語の意味(meaning or sense)が、ソフトウェア・プログラムによって生成され、3つのオリジナル単語の1つまたは複数の同義単語または同義文が生成される。これによって、オリジナルと同一の意味(meaning or sense)を有するが著作権法に違反しない、オリジナルの単語、文、またはテキストの同等の単語、文、またはテキストが生成される。3つより多数または少数の単語を、オリジナルのテキストまたはテキストの一部の言い換え(rewording or rephrasing)のために処理することができることを理解されたい。] [0103] 図4aに、読取りヘッド移動をかぶせられた新聞の架空の第1面のセクションを示し、スキャンは、全体的に図1と同様に機能する。開始点は、文書ページの左上角にある。最初の3つのピープホール・スキャン(PHスキャン)501、502、503は、内容をマークせず、クリアされるか空白(ほぼ同一の色)によって上書きされる。4番目のPHスキャン、PH4 504は、情報を含むが、文字は、OCRによって認識されない。したがって、5番目の垂直のPHスキャン、PH5 505が、要求され、PH4と組み合わされる。OCRは、組み合わされたスキャンPH4+PH5を調べ、文字「Thurs」およびさらなる何かを検出する。スキャン・シーケンサは、6番目および7番目のスキャン、PH6 506およびPH7 507を要求する。スキャンPH4+PH5+PH6+PH7が、組み合わされ、ジグソーOCRに提示される。このOCRは、単語「Thursday」、文字「30t」、およびさらなる何かを返す。スキャン・シーケンサは、次のスキャンを要求することによって継続する。単語「Thursday」およびたとえばそのフォント・サイズを、ワード・リコグナイザに転送することができる。フォント・サイズに起因して、この単語を、見出しまたはタイトル文に属するものとして分類することができる。次のスキャンを用いて、単語「Newspaper」が認識されるなどである。] 図1 図4a [0104] 図4bに、本文テキストのスキャンを示すが、このスキャンは、図1に示された類似する検索戦略に従い、段階的に、一文字ずつ発見し、一単語ずつ組み立て、各単語は、インデックス・リストに保存される。その後、インデックス・リストをキーワード・リストと比較することができる。ある単語がキーワード・リスト内で見つからない場合には、その単語によって占められる区域を、空白で上書きすることができる。] 図1 図4b [0105] 図4bの例は、垂直スキャン・シーケンスを示す。検索プロセスは、次の単語「Infopaq」、ファースト・ネーム「Jacob」(継続符号を無視して)、および最後に示されたテキスト片内の名字「Meibom」を発見する。文書内のすべての絵を、空白にすることができる。] 図4b [0106] 図5に、ピープホール・スキャン・プロセスの例を示し、このプロセスは、全体的に図1と同様に機能する。図5a)では、スキャンされる文書600は、スキャンの前に、ある種のカバリングによって区域601で部分的に隠されるかカバーされている。図5a)に示されたカバーされた文書がスキャンされ終え、内容およびイメージが処理され、削除されたときに、図5b)にてわかるるように、文書600は、スキャンの前に、ある種のカバリングによって今度は反対の区域603で、やはり部分的に隠されるかカバーされる。] 図1 図5 図5a 図5b [0107] 図5a)に示されているように、たとえば従来のスキャナで部分的にカバーされた文書をスキャンするときには、文書のコピーは作られない。というのは、部分的なカバリングに起因して、文書の内容全体が可視または理解できるものではないからである。したがって、文書の区切られた区域602だけが、スキャンされ、スキャナのメモリに格納される。部分的にカバーされた文書のスキャンされたイメージは、光学文字認識(OCR)を実行するために処理される。登録された文字は、メモリに格納され、文字のストリングが得られるときには、そのストリングが、事前定義の条件に対して評価される。事前定義の条件が満足されるか否かに応じて、出力を提供することができ、ストリングの少なくとも一部およびスキャンされたイメージの少なくとも一部が、メモリからクリアされ、したがって、文書600の一部602だけを表すスキャンされたイメージの内容およびスキャンされたイメージ自体が、少なくとも部分的に削除される。したがって、最終的に、文書600の一部602だけを描くスキャンされたイメージ全体を削除することができ、したがって、文書600の一部602のスキャンは、もはやメモリに格納されなくなる。] 図5a [0108] ここで、図5b)に示されているように、同一の文書600が、前とは反対の区域603で部分的に隠されるかカバーされる。上で述べたように、たとえば従来のスキャナで部分的にカバーされた文書をスキャンするときには、文書のコピーは作られない。というのは、部分的なカバリングに起因して、文書の内容全体が可視または理解できるものではないからである。したがって、文書600の区切られた区域604だけが、スキャンされ、スキャナのメモリに格納される。部分的にカバーされた文書のスキャンされたイメージは、光学文字認識(OCR)を実行するために処理される。登録された文字は、メモリに格納され、文字のストリングが得られるときには、そのストリングが、事前定義の条件に対して評価される。事前定義の条件が満足されるか否かに応じて、出力を提供することができ、ストリングの少なくとも一部およびスキャンされたイメージの少なくとも一部が、メモリからクリアされ、したがって、文書600の一部604だけを表すスキャンされたイメージの内容およびスキャンされたイメージ自体が、少なくとも部分的に削除される。したがって、最終的に、文書600の一部604だけを描くスキャンされたイメージ全体を削除することができ、したがって、文書600の一部604のスキャンは、もはやメモリに格納されなくなる。] 図5b [0109] したがって、図5b)のように区域603内でカバーされた文書600のスキャンを開始するときに、図5a)に見られる区域601内でカバーされた文書600のスキャンされたイメージは、除去済みであり、したがって、文書600全体を描く完全なイメージは、絶対に存在しない。文書600の一部602は、文書600の一部604が記録され、処理され、削除される前に、認識され、処理され、メモリからクリアされる。] 図5a 図5b [0110] 区域602および604は、たとえばカバーされる区域601および603が斜めである場合または記録が多少斜めである場合に、文書の部分が失われないことを保証するために、部分的オーバーラップなど、互いにオーバーラップすることができる。] [0111] カバリング601、603は、文書600のうちでカバーされるべき部分の上に不透明の材料または実体を物理的に置くことによって実現することができる。その代わりにおよび/またはそれに加えて、カバリング601、603を、スキャナの読取りヘッドまたはガラス・ペインに不透明の材料または実体を物理的に置くことによって実現することができる。カバー材料は、たとえば、紙、不透明テープ、不透明プラスティック、金属、および/または類似物とすることができる。] [0112] 代替案では、カバリング601および603を、リーダー・ヘッドの電子マスキングまたは電子ゲーティングによって設けることができる。走査線は、たとえば、高さ1画素、長さ3000画素とすることができる。リーダー・ヘッドは、文書の各走査線の一部をスキャンし、各走査線の別の部分を削除することができる。たとえば、リーダー・ヘッドは、画素番号1〜100など、走査線の第1部分をスキャンし、画素番号100〜200など、走査線の第2部分を削除し、画素番号200〜300など、走査線の第3部分をスキャンし、画素番号300〜400など、走査線の第4部分を削除し、すべての走査線の各部分がスキャンされるか削除されるかのいずれかになるまでこれを続けることができる。その後、走査線のすべてのスキャンされた部分を処理した後に、それらがメモリからクリアされ、次に、画素番号1〜100など、走査線の第1部分を削除し、画素番号100〜200など、走査線の第2部分をスキャンし、画素番号200〜300など、走査線の第3部分を削除し、画素番号300〜400など、走査線の第4部分をスキャンするなど、前にスキャンされたのではなく削除された、走査線のすべての部分が、スキャンされ、前にスキャンされた走査線の部分が、今回は削除される。走査線の部分の削除は、メモリヘの入力が行われないことすなわち、走査線の部分の内容が抑止されまたは無視されることを含む。] [0113] 新聞ページ上では、字または文字は、高さ15〜20画素である場合があり、1ページが、長さ3000画素である場合があり、これは、上で述べた走査線に対応する。したがって、走査線の部分のスキャンまたは削除によって、図5に見られるカバリングに対応する電子マスキングを得ることができる。] 図5 [0114] さらに、絵は、通常、グレイスケールまたはカラー変形形態であり、文書上のグレイスケールまたはカラー変形形態が、たとえばリーダー・ヘッドによるなど、スキャナによって検出されるときに、グレイスケールまたはカラー変形形態を含む画素は、ある値を割り当てられ、このある値を有するすべての画素は、その後、絵である可能性があるこれらの画素の内容を隠すために、クリアされるかカバーされる。] [0115] カバリング601、603の形態および形状は、図5に見られるように列とすることができる。その代わりにおよび/またはそれに加えて、カバリング601、603の形態および形状を、正方形、チェック・パターン、格子、三角形、円、線、任意の個数の辺を有する多角形などとすることができる。] 図5
权利要求:
請求項1 −文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録をメモリに獲得するステップと、−文字認識を実行するために前記少なくとも1つの記録を処理するステップと、−文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップとを含む、文書をスキャンするコンピュータ実施する方法であって、−事前定義の条件に対して前記ストリングを評価することと、−条件が満足されない場合に、前記少なくとも1つの記録の少なくとも一部を前記メモリからクリアすべきかどうかを判定することと、−条件が満足される場合に、出力を提供し、前記ストリングの少なくとも一部および前記少なくとも1つの記録の少なくとも一部を前記メモリからクリアすることとを特徴とするコンピュータ実施される方法。 請求項2 前記事前定義の条件は、文字の前記ストリングが少なくとも1つの単語を含むことを含む、請求項1に記載のコンピュータ実施される方法。 請求項3 前記少なくとも1つの単語を含むインデックス・リストが提供される、請求項2に記載のコンピュータ実施される方法。 請求項4 前記少なくとも1つの単語は、前記単語が事前定義のストップワードのうちの1つと一致する場合に、前記インデックス・リストからクリアされる、請求項2に記載のコンピュータ実施される方法。 請求項5 単語は、前記単語の前および後にスペースがあるという点において識別される、請求項2に記載のコンピュータ実施される方法。 請求項6 単語は、前記単語の前にスペースがあり、前記単語の後に字とは異なる文字があるという点において識別される、請求項2に記載のコンピュータ実施される方法。 請求項7 単語は、1つまたは複数の言語のすべての単語を含むデータ・ベースによって識別され、文字の前記ストリングと前記データ・ベース内の単語との間に一致がある場合に、文字の前記ストリングは単語と定義される、請求項2に記載のコンピュータ実施される方法。 請求項8 前記出力は、前記少なくとも1つの単語である、請求項1に記載のコンピュータ実施される方法。 請求項9 前記出力は、前記少なくとも1つの単語が配置される前記文書内のロケーションへの参照である、請求項1に記載のコンピュータ実施される方法。 請求項10 前記少なくとも1つの単語の前記文書内のロケーション/位置に関する情報は、生成され、格納される、請求項1または2に記載のコンピュータ実施される方法。 請求項11 前記少なくとも1つの単語は、コードとして表される、請求項1または2に記載のコンピュータ実施される方法。 請求項12 前記出力は、前記インデックス・リストおよびスキャンの対象である前記文書内の対応する単語のロケーションを表す位置への参照を含む、請求項3に記載のコンピュータ実施される方法。 請求項13 生成されるキーワード・リストは、複数の所定のキーワードを含む、請求項1に記載のコンピュータ実施される方法。 請求項14 前記キーワード・リストは、前記インデックス・リストと比較され、前記キーワード・リスト内のキーワードと前記インデックス・リスト内の単語との間に一致がある場合に、この単語は抽出される、請求項13に記載のコンピュータ実施される方法。 請求項15 条件が満足されない場合に、前記少なくとも1つの記録の少なくとも一部を前記メモリからクリアすべきかどうかを判定することは、評価された文字の個数を判定することを含み、−事前定義の個数未満の文字が評価されている場合に、前記少なくとも1つの記録の少なくとも一部はクリアされず、−事前定義の個数以上の文字が評価されている場合に、前記少なくとも1つの記録の少なくとも一部はクリアされる請求項1乃至14のいずれか1項に記載のコンピュータ実施される方法。 請求項16 条件が満足されない場合に、前記ストリングの少なくとも一部を前記メモリからクリアすべきかどうかを判定することをさらに含む、請求項1乃至15のいずれか1項に記載のコンピュータ実施される方法。 請求項17 選択された記録を一緒に合成記録に縫い合わせることを含む、請求項1乃至16のいずれか1項に記載のコンピュータ実施される方法。 請求項18 前記合成記録は、複数の選択された記録にまたがって延びる文字の認識を実行するために処理される、請求項17に記載のコンピュータ実施される方法。 請求項19 選択された記録を一緒に合成記録に縫い合わせるステップは、文字を認識するための前記少なくとも1つの記録の処理が文字の認識をもたらさなかったときに実行される、請求項17に記載のコンピュータ実施される方法。 請求項20 前記事前定義の条件は、縫い合わされた合成記録が、事前定義の個数の記録が縫い合わされたときに文字の認識をもたらすかどうかを含む、請求項1および17に記載のコンピュータ実施される方法。 請求項21 前記事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む、請求項1および17に記載のコンピュータ実施される方法。 請求項22 前記事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む、請求項1および17に記載のコンピュータ実施される方法。 請求項23 前記事前定義の条件は、同一の色が隣接する記録に現れることを含む、請求項1および17に記載のコンピュータ実施される方法。 請求項24 前記合成記録は、事前定義の条件が満足されるときにクリアされる、請求項17に記載のコンピュータ実施される方法。 請求項25 前記フィールドは、連続するテキスト内で互いの隣に配置された11個の単語という寸法を有するように構成される、請求項1乃至24のいずれか1項に記載のコンピュータ実施される方法。 請求項26 前記フィールドは、前記文書の幅および前記文字のフォント・サイズの高さに対応する寸法を有するように構成される、請求項1乃至25のいずれか1項に記載のコンピュータ実施される方法。 請求項27 前記フィールドは、文字認識の対象になる最小文字のサイズの5倍未満の寸法を有するように構成される、請求項1乃至24のいずれか1項に記載のコンピュータ実施される方法。 請求項28 少なくとも2つの記録は、同時に獲得される、請求項1乃至27のいずれか1項に記載のコンピュータ実施される方法。 請求項29 コンピュータ上で実行されるときに請求項1乃至27のいずれか1項に記載の方法を実施するプログラムを符号化されたコンピュータ可読媒体。 請求項30 スキャン・デバイスと、プログラムがコンピュータ上で実行されるときに請求項1乃至27のいずれか1項に記載の方法を実施する前記プログラムをロードされた前記コンピュータとを含むシステム。 請求項31 −文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録を獲得するスキャン・ヘッドと、−前記記録内の文字を認識するように適合されたプロセッサと、−前記少なくとも1つの記録を格納し、認識された文字を格納するデータ・メモリと、−請求項1乃至28のいずれか1項に記載の方法を実行するために前記プロセッサ上の実行可能プログラム命令のセットを格納するプログラム・メモリとを含む文書スキャナ。
类似技术:
公开号 | 公开日 | 专利标题 Kleber et al.2013|Cvl-database: An off-line database for writer retrieval, writer identification and word spotting CN102117269B|2014-06-04|对文档进行数字化的装置及方法 JP5181888B2|2013-04-10|グラフィカルユーザインターフェースを生成する方法及びシステム US6909805B2|2005-06-21|Detecting and utilizing add-on information from a scanned document image US7391917B2|2008-06-24|Image processing method JP4350414B2|2009-10-21|情報処理装置及び情報処理方法ならびに記憶媒体、プログラム JP2862626B2|1999-03-03|電子辞書及び情報検索方法 US7552381B2|2009-06-23|Check boxes for identifying and processing stored documents DE69731418T2|2005-11-10|Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen US6640010B2|2003-10-28|Word-to-word selection on images JP3289968B2|2002-06-10|電子的文書処理のための装置および方法 JP3292388B2|2002-06-17|文書画像の復号なしに文書を要約するための方法と装置 Lu et al.2008|Document image retrieval through word shape coding JP3504054B2|2004-03-08|文書処理装置および文書処理方法 JP4895340B2|2012-03-14|情報処理装置およびその方法 CA2116600C|1996-11-05|Methods and apparatus for inferring orientation of lines of text JP3232144B2|2001-11-26|文章中の単語文節の出現頻度を求めるための装置 US8644621B2|2014-02-04|Image processing apparatus and image retrieval method EP0677818B1|2000-05-10|Image pre-processor for character recognition system US5860075A|1999-01-12|Document data filing apparatus for generating visual attribute values of document data to be filed US5809167A|1998-09-15|Page segmentation and character recognition system US8077971B2|2011-12-13|Image processing apparatus, image processing method, and computer program US7742642B2|2010-06-22|System and method for automated reading of handwriting JP4393161B2|2010-01-06|画像処理装置及び画像処理方法 JP4369785B2|2009-11-25|マルチメディア書類を管理するシステム、mfp、集合サーバ及び方法
同族专利:
公开号 | 公开日 US20100321714A1|2010-12-23| SMP201000111B|2011-09-09| GEP20135843B|2013-06-10| WO2009109626A1|2009-09-11| US8520224B2|2013-08-27| BRPI0909816A2|2019-09-24| IL207979D0|2010-12-30| CA2717323A1|2009-09-11| CN101981568A|2011-02-23| SMAP201000111A|2011-01-19| MX2010009614A|2011-03-02| DK176835B1|2009-11-23| DK200800345A|2009-09-08| EP2263172A1|2010-12-22| EA201071041A1|2011-04-29|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题 JPS62106574A|1985-11-05|1987-05-18|Hitachi Ltd|Registration retrieving system for document picture file| JPH02118786A|1988-10-28|1990-05-07|Nec Home Electron Ltd|Method for recognizing character| EP0465818A2|1990-06-12|1992-01-15|Horst Froesel|Mass document storage and retrieval system| JPH09198404A|1996-01-23|1997-07-31|Canon Inc|文書処理方法及び装置| JP2000059588A|1998-08-12|2000-02-25|Minolta Co Ltd|画像処理装置| JP2001218010A|2000-01-31|2001-08-10|Canon Inc|画像処理装置、画像処理方法、記憶媒体| US20010019636A1|2000-03-03|2001-09-06|Hewlett-Packard Company|Image capture systems| JP2004318875A|2003-04-04|2004-11-11|Dainakomu:Kk|カルテ画像の読み取り| JP2006172083A|2004-12-15|2006-06-29|Canon Inc|文書登録システム| US20080021938A1|2006-06-29|2008-01-24|Ashish Jha|Technique for allocating objects in a managed run time environment|JP2011513850A|2008-03-07|2011-04-28|ジェイエルホールディングスエーピーエス|スキャンの方法|JPS6042990B2|1978-05-22|1985-09-26|Hitachi Ltd|| US4731861A|1983-08-26|1988-03-15|Texas Instruments Incorporated|Method of optical character recognition| JP4153989B2|1996-07-11|2008-09-24|株式会社日立製作所|文書検索配送方法および装置| AU7289801A|2000-04-11|2001-10-23|Sandia Corp|Microelectromechanical apparatus for elevating and tilting a platform| US6904182B1|2000-04-19|2005-06-07|Microsoft Corporation|Whiteboard imaging system| US6944344B2|2000-06-06|2005-09-13|Matsushita Electric Industrial Co., Ltd.|Document search and retrieval apparatus, recording medium and program| DE60118399T2|2000-08-24|2006-12-07|Olive Software, Inc., Denver|System und verfahren zur automatischen aufbereitung und suche von abgetasteten dokumenten| US20050076013A1|2003-10-01|2005-04-07|Fuji Xerox Co., Ltd.|Context-based contact information retrieval systems and methods| EP2087448A1|2006-11-21|2009-08-12|Cameron Telfer Howie|A method of retrieving information from a digital image| US8209605B2|2006-12-13|2012-06-26|Pado Metaware Ab|Method and system for facilitating the examination of documents|US8924251B2|2010-12-13|2014-12-30|Vlsi Research Inc.|Systems and methods for providing one or more pages from an electronic document| US9459868B2|2012-03-15|2016-10-04|International Business Machines Corporation|Instruction to load data up to a dynamically determined memory boundary| US9715383B2|2012-03-15|2017-07-25|International Business Machines Corporation|Vector find element equal instruction| US9280347B2|2012-03-15|2016-03-08|International Business Machines Corporation|Transforming non-contiguous instruction specifiers to contiguous instruction specifiers| US9588762B2|2012-03-15|2017-03-07|International Business Machines Corporation|Vector find element not equal instruction| US9459867B2|2012-03-15|2016-10-04|International Business Machines Corporation|Instruction to load data up to a specified memory boundary indicated by the instruction| US9268566B2|2012-03-15|2016-02-23|International Business Machines Corporation|Character data match determination by loading registers at most up to memory block boundary and comparing| US9710266B2|2012-03-15|2017-07-18|International Business Machines Corporation|Instruction to compute the distance to a specified memory boundary| US9454366B2|2012-03-15|2016-09-27|International Business Machines Corporation|Copying character data having a termination character from one memory location to another| US9454367B2|2012-03-15|2016-09-27|International Business Machines Corporation|Finding the length of a set of character data having a termination character| US9459864B2|2012-03-15|2016-10-04|International Business Machines Corporation|Vector string range compare| US9635204B2|2015-09-17|2017-04-25|International Business Machines Corporation|Partial information capture and processing|
法律状态:
2012-02-28| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120227 | 2012-07-11| RD04| Notification of resignation of power of attorney|Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120710 | 2013-08-15| A977| Report on retrieval|Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130814 | 2013-08-28| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130827 | 2014-02-19| A02| Decision of refusal|Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140218 |
优先权:
[返回顶部]
申请号 | 申请日 | 专利标题 相关专利
Sulfonates, polymers, resist compositions and patterning process
Washing machine
Washing machine
Device for fixture finishing and tension adjusting of membrane
Structure for Equipping Band in a Plane Cathode Ray Tube
Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an
国家/地区
|